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摘要 :【 目 的 ] 本 研究 旨 在 探索 使 用 计算 机 视觉 技术 实现 对 昆虫 图 像 的 自动 分 类 方法 。[ 方 法 ] 首 先 通过 预 处 理 对 
采集 的 昆虫 标本 图 像 去 除 背 景 ,分 割 出 双 这 ,并 对 起 图 像 的 位 置 进行 校正 。 然 后 把 校正 后 的 翅 面 沿 翅 伸 展 的 纵 癌 
和 切 向 分 成 4 个 区 域 , 对 每 个 区 域 提 取 WLD (Weber Local Descriptor) 和 HoC ( Histogram of Color) 特征 并 归 一 化 。 
WLD 在 灰 度 图 像 上 提取 ,反映 了 翅 图 像 的 局 部 纹理 特征 。Hoc 则 在 HSI( Hue，Saturation，Intensity ) 颜色 空间 的 彩 
色 图 像 上 提取 ,反映 了 每 个 区 域 的 颜色 分 布 信息 。 将 双 翅 的 各 个 区 域 的 WLD 和 HoC 按 序 连 接 后 ,得 到 该 昆虫 图 像 
的 特征 向 量 。 使 用 昆虫 图 像样 本 训练 集 提取 到 的 特征 向 量 训练 SVM(Support Vector Machine ) 分 类 器 ,最 后 使 用 这 
些 训练 得 到 的 分 类 器 即 可 实现 对 鳞 翅 目 昆虫 的 分 类 识别 。【 结 果 ] 该 方法 在 包含 10 种 576 个 样本 的 昆虫 图 像 数据 
库 中 进行 了 测试 ,取得 了 100% 的 独立 预测 精度 ,并 有 理想 的 时 间 性 能 、 和 鲁 棒 性 及 稳定 性 。【 结 论 ] 实验 结果 证 明了 
WLD 结合 HoC 是 一 种 有 效 的 鳞 翅 目 昆 虫 图 像 特征 描述 方式 。 
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Feature description of lepidopteran insect wing images based on WLD 


and HoC and its application in species recognition 
ZHU Le-Qing”*, ZHANG Da-Xing’, ZHANG Zhen (1. School of Computer Science and Information 
Engineering, Zhejiang Congshang University, Hangzhou 310018, China; 2. Institute of Graphics and 
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Image, Hangzhou Dianzi University, Hangzhou 310012, China; 3. Key Laboratory of Forest Protection of 
State Forestry Administration, Research Institute of Forest Ecology, Environment and Protection, Chinese 
Academy of Forestry, Beijing 100091, China) 

Abstract: [Aim) This study aims to explore the method to realize the automatic insect image recognition 
based on computer vision technology. 【 Methods 】The captured insect image was first preprocessed to 
remove the background, and were segmented into two pairs of wings, and the position of the wings was 
calibrated. Then the calibrated wings were divided into several regions along radial and angular directions. 
WLD (Weber Local Descriptor) and HoC (Histogram of Color) features were extracted and normalized in 
each region. The WLD features are extracted on grayscale image, reflecting the local texture feature of wing 
images. HoC features were extracted on HSI (Hue, Saturation, Intensity) color space, reflecting the color 
distribution information of the region. The WLD features and HoC features from all the regions of two pairs 
of wings were concatenated into a feature vector of the insect image. The feature vectors extracted from the 
insect image samples in training set were used to train the SVMs (Support Vector Machines) which were 
finally used to classify lepidopteran insects. [Results)] The proposed method was tested in a database with 
576 images and the standalone prediction accuracy was as high as 100% , and the system also demonstrated 
ideal time performance ，good robustness and high stability. 【 Conclusion 】The experimental results prove 
that the combination of WLD and HoC is an effective method for insect image feature description. 

Key words: Insect; Lepidoptera; image recognition; Histogram of Color ( HoC ) ; Weber Local 
Descriptor (WLD ) ; Support Vector Machine (SVM ) 
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昆虫 是 世界 上 种 类 和 数量 最 多 ,分 布 最 广 的 动 
物 ,与 人 类 的 生活 又 密切 相关 。 明 确 昆虫 种 类 、 分 布 
及 其 活动 ,对 认识 与 保护 昆虫 多 样 性 ,促进 农林 业 生 
产 和 生态 环境 保护 有 重要 的 学 术 意义 和 应 用 前 景 。 
将 先进 的 图 像 处 理 ,模式 识别 等 计算 机 视觉 及 信和 号 处 
理 技术 应 用 于 昆虫 分 类 与 识别 领域 ,实现 昆虫 的 自动 
识别 ,对 于 提高 人 类 认识 的 普及 度 ,减少 农业 生产 中 
因为 昆虫 引起 的 病虫害 ,避免 经 济 损失 ,有 效 地 保护 
珍稀 昆虫 物种 ,维护 生态 环境 平衡 ,具有 不 可 忽略 的 
作用 ( 黄 世 国 , 2008 ) 。 昌 然 仅 赁 昆虫 的 图 像 ,对 于 有 
些 近似 物种 ,无 法 全 然 区 分 开 , 但 至 少 可 以 将 昆虫 种 类 
缩小 到 少数 几 种 范围 之 内 ,从 而 达到 辅助 鉴定 的 目的 。 

早 在 20 世纪 90 年 代 , 就 有 工程 技术 人 员 展 开 
了 对 昆虫 自动 鉴定 方法 的 研究 。 如 Liu (1996 ) 提出 
的 基于 计算 机 视觉 技术 的 卷 蛾 类 (Tortricinae ) 昆虫 
自动 识别 方法 ;Albrecht 和 Kaila( 1997 ) 提出 的 小 湾 
蛾 科 (Elachistidae ) 昆虫 识别 方法 ;Adsavakulchai 等 
(1998 ) 提出 的 橘 小 实 晶 Bactrocera dorsalis 混合 种 群 
鉴定 方法 ; Tofilski (2004) 开发 的 自动 测量 黄蜂 
Dolichovespula 和 晴 蝶 Aeshna juncea 的 翅 脉 特征 的 软 
件 DrawWing 及 Andrew 和 Carolyn (2008 ) 开 发 的 基 
于 网 络 的 计算 机 辅助 昆虫 鉴别 工具 BugWing 都 是 
基于 却 脉 特征 的 。 还 有 一 些 方法 是 基于 形态 学 特征 
的 ,如 沈 伍 锐 和 于 文 新 等 (1998 ) 提出 的 用 面积 、 偏 
心率 形状 参数 等 11 项 数学 形态 学 特征 作为 昆虫 图 
像 识别 ( 赵 汗 青 等 , 2002， 于 新 文 等 ,2003 ) 的 依 
据 ; 姚 青 等 (2001 ) 以 翅 面 正 投影 周 缘 曲 率 为 指标 ， 
对 5 种 蛾 类 迁 飞 昆虫 及 与 其 近似 的 非 迁 飞 昆 虫 的 前 
起 翅 形 进行 数值 分 析 和 比较 从 而 实现 识别 。 此 外 ， 
随 着 图 像 处 理 技 术 的 发 展 ,近年 来 又 出 现 了 一 些 新 
型 的 昆虫 图 像 识别 方法 ,如 Wen 等 (2009) 利 用 不 变 
区 域 特征 检测 器 和 尺度 不 变 特征 变换 (SIFT) 提取 
特征 ,并 比较 了 6 种 分 类 器 对 5 种 果园 昆虫 的 分 类 
效果 ;美国 华盛顿 大 学 的 Larios 等 (2010 ) 提出 的 使 
用 Haar 随机 和 森林 提取 特征 ,通过 鉴定 祯 翅 目 
(Plecoptera) 石 晶 的 种 类 和 数量 来 监测 河流 等 水 环 
境 的 生态 与 健康 情况 ;Al-Saqer 等 (2011 ) 用 归 一 化 
交叉 相关 、Fourier 描述 子 Zernike 和 矩 . 串 匹配 和 区 域 
属性 等 5 种 方法 相 结合 的 处 理 方式 实现 了 核桃 象 虹 
虫 (pecan weevils ) 的 识别 。 

上 述 方法 都 是 针对 特定 范围 内 的 昆虫 识别 展开 
研究 ,如 翅 脉 特征 比较 适合 具有 透明 翅 的 昆虫 识别 ， 
形状 特征 则 适用 于 形状 稳定 且 有 独特 性 的 昆虫 ; 
SIFT 特征 通常 也 只 考虑 局 部 灰 度 分 布 特性 。 对 于 















































































































































鳞 翅 目 昆 虫 而 言 , 大 多 数 种 的 翅 表 面 禾 盖 有 细微 的 
鲜 片 ,这些 鳞片 通 常 色彩 丰富 ,花纹 独特 ,而 且 具 有 
种 内 相似 性 和 种 间 区 分 性 ,可 以 作为 图 像 识 别 的 重 
要 依据 。 因 此 本 文 对 鳝 翅 目 昆虫 图 像 自动 识别 展开 
研究 ,同时 提取 鳝 翅 目 昆虫 翅 表 面 的 颜色 分 布 特征 
和 纹理 特征 ,生成 定 长 特征 向 量 , 训 练 分 类 器 ,最 终 
实现 鳞 翅 目 昆虫 的 自动 分 类 。 























1 材料 与 方法 


1.1 鳞 翅 目 昆 虫 图 像 预 处 理 

本 实验 使 用 的 昆虫 图 像 是 用 数码 相机 对 昆虫 标 
本 拍摄 得 到 ,标本 头 部 在 上 ,两 翅 向 左右 两 侧 展开 ， 
图 片 中 与 昆虫 无 关 的 背景 已 去 除 并 被 置 为 黑色 。 昆 
虫 图 像 预 处 理 的 算法 流程 已 在 本 文 作 者 的 相关 文献 
(Zhu and Zhang, 2012) 中 作 详 细 介绍 ,本 文 不 再 展 
开 , 如 需 了 解 请 查阅 该 文献 。 预 处 理 之 前 的 图 像 和 
处 理 后 得 到 的 图 像 如 图 1。 

















D 
图 1 昆虫 图 像 及 预 处 理 结果 


Fig. 1 Insect image and the preprocessed results 
A: 原 图 Origin image; B: 左 翅 Left wing; C: 左 翅 蒙 板 Left wing 
mask; D: 右 翅 Right wing; E: 右 翅 蒙 板 Right wing mask. 
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1.2 昆虫 图 像 特征 提取 

本 文 使 用 颜色 特征 和 纹理 特征 联合 描述 鳞 翅 目 
昆虫 翅 图 像 。 颜 色 特 征 使 用 区 域 颜色 直方 图 ,而 纹 
理 特征 则 使 用 了 韦伯 局 部 描述 子 (Weber Local 
Descriptor ，WLD) (Chen et al., 2010)。 
1.2.1 区 域 颜色 直方 图 :为 了 尽 可 能 减少 光照 变化 
带 来 的 影响 ,本 实验 首先 把 预 处 理 得 到 的 翅 图 像 从 
RGB(Red，GCreen ，Blue ) 颜色 空间 转化 到 HSI( Hue， 
Saturation ，Intensity ) 颜色 空间 ,并 且 仅 使 用 正和 S$ 
分 量 , 舍 弃 了 工分 量 , 因 为 考虑 到 工分 量 受 光 照 强 弱 
影响 较 大 。 并 将 翅 面 图 像 沿 纵向 和 切 向 分 为 上 下 左 
右 4 个 区 域 ,分 别 统计 每 个 区 域 处 于 蒙 板 内 的 像素 
的 2D 颜色 直方 图 ,如 图 2 所 示 。 我 们 认为 HH 分 量 
所 含 的 色 度 信息 比 饱 和 度 信 息 更 重要 ,因此 在 量化 
时 HH 分 量 的 量化 单位 相对 较 小 ,以 期 取得 更 高 的 区 
分 能 力 ,综合 考虑 特征 癌 量 的 长 度 和 区 分 能 力 ,在 本 
文中 将 日 分 量 分 为 8 个 区 间 ,S 分 量 则 只 分 4 个 区 
间 ,这 样 每 个 区 域 可 得 到 长 度 为 4x8 =32 的 2D 颜 
色 直 方 图 特征 向 量 (图 3)。 将 4 个 区 域 的 向 量 首尾 
连接 , 则 得 到 32 x4 = 128 维特 征 向 量 , 左 右 翅 连 接 
则 为 256 维 。 


























图 2 昆虫 翅 面 区 域 划分 


Fig. 2 ”Region division of insect wing 
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到 3 ”昆虫 女 面 各 区 域内 S 和 HH 分 量 2D 直方 图 示意 图 


Fig. 3 Illustration of the 2D histogram of Saturation and 























Hue components for each region of insect wing 


1.2.2 WLD 特征 提取 : 韦伯 法 则 ;19 世纪 的 实验 
心理 学 家 Erst Weber 观察 到 人 们 对 能 感知 到 的 最 
低 信号 变化 量 与 背景 信号 强度 的 比例 是 一 个 常数 














(Jain，1989 )。 这 个 被 称 为 韦伯 法 则 的 关系 可 表 
示 为 : 
4 - 
了 
这 里 A 表示 信号 变化 量 的 阔 值 (正好 可 被 注意 
到 的 变化 量 ) ,7 表示 初始 刺激 强度 ,k 为 比例 因子 ， 
不 论 了 如 何 变化 ,上 保持 为 常数 ,分 式 AL 被 称 为 韦 
伯 分 式 。 
简 而 言 之 ,韦伯 法 则 指出 恰好 能 被 注意 的 变化 
量 大 小 与 原来 的 刺激 量 成 正常 数 比 例 关 系 。 例 如 ， 
在 品 杂 的 环境 中 讲话 必须 大 声 喊 ,而 安静 的 环境 中 
只 要 轻声 讲 就 可 以 被 听 到 。 
1.2.3 WILD 特征 提取 :图 4 给 出 了 昆虫 翅 图 像 
WLD 特征 的 提取 方法 。WLD 包括 两 个 成 分 :差分 
激励 & 和 方向 9。 
差分 激励 :差分 激励 反映 的 是 当前 像素 与 其 
周围 像素 的 差异 ,目的 是 找 出 一 幅 图 像 在 人 眼 视觉 
感知 中 变化 比较 明显 的 区 域 。 设 当前 像素 点 为 *。， 
则 该 点 的 差分 激励 为 E(x.) ,首先 计算 x*。 和 邻 域 像 
素 的 不 同 ,如 式 (2) 所 示 : 
w= 2 (Ar) = Pe = Xe) (2) 
其 中 心 i=0,1,…, p -1) 表 示 x, 的 第 ; 个 相 邻 像 
素 ,p 是 它 的 相 邻 像素 数量 。 如 采用 3 x3 的 区 域 ， 
则 p=8( 图 4)。 受 韦伯 法 则 所 启发 ,我 们 进一步 可 
计算 差分 激励 与 当前 像素 强度 的 比值 ,这 一 比值 可 
通过 计算 两 个 滤波 带 f。 和 (其 输出 实际 上 是 原 图 
本 身 ) 的 输出 之 比 得 到 : 
Gaio (Xe) = 0 /0 (3) 
在 Gio(“) 上 计算 其 反正 切 函 数 T: 
Taal G(X.)1 = arctan[ Ci (%.)] = 


k (1) 














Xi 





-7)] (4) 


arctan[ 二 ] = arctan | > 
因此 ,差分 激励 &(x,) 的 计算 方法 为 : 
= 


1 RE 
三 t 二 党 | 
E(xX.) = arc 0[ 庙 arctan| put ~ 


由 上 式 可 知 ,如 当前 像素 大 于 其 令 域 像素 均值 时 , 即 
E(x。) <0, 说 明 当 前 点 在 该 区 域 亮 度 较 高 ,反之 , 则 
说 明 周 围 各 点 的 亮度 大 于 当前 点 。 

在 本 文中 ,我们 希望 计算 得 到 的 差分 激励 能 归 
一 化 到 [0,1] 区 间 内 ,并 适当 对 当前 像素 与 其 邻 域 
的 像素 差异 进行 放大 ,修正 后 的 计算 公式 如 下 : 


Ni 








é' (x.) = Larctan( He—) + 工 ]M7 = 


+B 2 
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值 为 0 时 分 母 为 0 的 情况 ,a 为 缩放 因子 。 











TT 
-一 6 
lt 方向 角 ; 如 图 4 所 示 , WLD 中 的 方向 成 分 为 榜 
其 中 8 是 一 个 较 小 的 整数 ,避免 出现 当前 像素 度 方向 (ITowe ，2004) 计算 公式 如 下 ， 
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图 4 计算 WLD 描述 子 示意 图 (Chen et al., 2010) 
Fig. 4 Tllustration of the computation of the WLD descriptors (Chen et al., 2010) 





a (7) 4 0 上 和 
Vs l 0O+T v=0 有 vw <0 
其 中 wv 和 分 别 为 滤波 器 名 和 , 的 输出 : Or ee i 
人 9+27 os<0 HH w=0 
pe. > 在 这 里 ,0 < 本 i 六 


e [0,27] ,这 一 映 


0 wa o ik 
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加 -Ai(e) = 名 mt = mod(|2 + 十 |, 站。 参数/ 涉 是 图像 的 我 。 为 进一步 分 类 ,我 们 杷 一 
7 27/7 2 向 量 |WLD( ,8,) | 映射 成 一 维 向 量 ,如 图 5, 首 先 将 
(10) [WLD(& ,0,) 1 按照 像素 的 梯度 方向 分 解 成 7 个 子 


例如 图 4 中 , 取 7=8, 则 7 了 个 主 方向 为 B, = (im)/ 
4,(t=0,1,…,7T-1) ,换言之 , 几 是 落 在 区 间 [ 到 - 
TAT,B, + mm/T] 的 角度 值 都 量化 为 @,。 

WILD 直方 图 :利用 式 (6) 和 式 (10) 分 别 计算 得 


序列 H(t) ,t=0, 1,…, 7 了-1,H(t) 表 示 该 梯度 方向 
上 的 差分 激励 。 然 后 对 (it) 进行 量化 ,按照 &(x, ) 的 
取 值 范围 平均 分 成 必 个 区 间 , 即 Hm,i(m=0, 1,…， 
叶 -1) , 1 是 差分 激励 的 量化 参数 。 已 知 é(x。) 的 取 

















到 图 像 中 每 个 像素 的 差分 激励 和 方向 值 后 ,可 以 得 。 值 范围 为 1=[0,27] ,把 /平均 分 为 屠 段 , 则 第 m 上段 
到 图 像 的 二 维 向 量 表示 | WLD(&,8,)| 其 中 j=0， 为 (m=0,1,…, 及 -1), 设 =[n4-1,7wj], 则 下 





1,…,N-1, t=0, 1 ,…, 7-1, 了 是 方向 角 的 量化 。 界 m,_) =2zm/M 上 界 =27(m+1)/M。 





主 方向 上 差分 激励 
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图 5 ”图像 WLD 直方 图 生成 示意 图 ( Chen et al., 2010) 














Fig. 5 An illustration of a WLD histogram for a given image (Chen et al., 2010) 





在 本 文中 ,为 简化 计算 ,选择 的 量化 参数 为 M = 
6,7=8, 因 为 每 个 翅 图 像 大 小 会 有 变化 ,图 像 的 大 
小 受 距 离 远 近 影 响 , 为 消除 这 种 影响 ,我 们 对 最 终 得 
到 的 WLD 直方 图 进行 了 归 一 化 处 理 , 即 

H',, = KH,,/N (11) 
其 中 下 为 常数 ,主要 目的 是 放大 特征 的 数值 ,本 文 
取 100,w 为 如 图 1(C) 或 (上 ) 所 示 的 白色 蒙 板 内 的 
像素 的 数量 , 即 翅 图 像 有 效 前 景区 域内 的 像素 总 数 。 
1.2.1 节 提 取 的 颜色 直方 图 也 采用 了 同样 的 方式 进 
行 了 归 一 化 。 

分 别 对 如 图 2 所 示 的 4 个 区 域 分 别提 取 WLD 
直方 图 ,每 个 区 域 将 得 到 以 x7=6 x8 =48 维 的 特 
征 向 量 ,4 个 区 域 连接 得 4 x48 = 192 维 的 特征 癌 
量 ,将 左右 双 翅 向 量 串 接 得 到 2 x 192 =384 维 的 
WLD 特征 向 量 。 再 将 1.2. 1 节 提 取 的 颜色 直方 图 
向 量 联 连 ,最 终 每 个 昆虫 图 像 将 提取 到 长 度 为 384 




















+256 =640 的 特征 向 量 。 
1.3 基于 SVM(Support Vector Machine ) 的 昆虫 
分 类 识别 

文 持 向 量 机 是 优秀 的 基于 统计 学 习 的 分 类 器 ， 
对 小 样本 训练 集 特别 有 效 。SVM 属于 一 种 最 大 间 
院 分 类 器 ,通过 找到 一 个 与 训练 集 ( 包 括 正 例 和 负 
例 ) 中 的 最 近 点 ( 称 为 支持 向 量 ) 距 离 最 大 的 超 平面 
实现 两 类 之 间 的 模式 识别 。 假 如 训练 集 为 x;, i 
1, 2, …，N ,其 中 每 个 点 x; 属 于 用 标签 ti,e | -1， 
11 标 示 的 两 类 之 中 的 一 类 。 对 线性 可 分 数据 ,分 类 
就 是 要 找 出 这 样 一 个 超 平面 ,使 得 支持 向 量 到 超 平 
面 的 距离 最 大 化 ,该 超 平面 称 为 最 优 分 离 超 平面 
(Optimal Separating Hyperplane，OSH ) 。OSH 具有 
如 下 形式 : 


f(x) = 2 ti(% x) +d 



































(12) 
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式 (12) 中 的 系数 和 vd 为 二 次 规划 问题 的 解 
(Vapnik, 1998). 对 一 个 新 数据 点 x 的 分 类 只 要 通 
过 求解 上 式 右 端的 符号 就 可 实现 。 以 上 过 程 可 以 扩 
展 到 非 线 性 分 离 平 面 的 构造 。 输 入 空间 的 每 个 点 x 
可 以 映射 到 更 高 维 的 称 为 特征 空间 的 点 z = B(x)， 
在 该 空间 中 数据 由 超 平面 分 开 。 在 这 个 过 程 中 最 关 
键 的 一 个 属性 是 映射 B(. ) 必须 满足 如 下 条 件 : 在 
特征 空间 的 两 点 的 点 积 B(x) ,B(y) 可 以 用 一 个 核 
函数 K(x,y) 来 描述 。 此 时 超 平 面 描 述 为 (Nello and 
John, 2000) : 
































f(x) = PaitiK(x ,i) +d 
其 中 i; 是 理想 的 输出 ，d 是 学 习 得 到 的 常量 ， 
2 ai = 0 ,oa >0, % 是 由 优化 过 程 从 训练 得 到 的 


支持 向 量 。 理 想 的 输出 根据 对 应 的 支持 向 量 属于 第 
1 类 或 第 2 类 分 别 取 1 或 -1, ai,d 也 是 在 优化 训 
练 过 程 中 得 到 的 SVM 参数 。/(x%) 与 特征 空间 的 维 
度 无 关 。 在 本 文中 ,我 们 使 用 了 多 项 式 核 函 数 : 
K(x,y) = (1 +x*y)" (14) 
这 里 h 是 多 项 式 的 阶 次 ,此 时 映射 函数 B(x) 是 
所 有 可 能 的 单项 式 输入 组 成 ,最 高 不 超过 hh 次 。 


2 结果 


(13) 






































上 述 方法 在 装 有 Visual Studio 2010 和 OpenCV 
的 PC 机 上 实现 ,CPU 为 Intel Core2 2. 53 GHz ,内 存 
为 3.46 G 。 我 们 创建 的 图 像 库 中 包含 10 类 昆虫 ， 





Panerapta vasava、 人 冬 麦 沁 夜 蛾 Rhyacia auguridis、 黑 
缘 岩 尺 峨 Scopula virgulata、 黄 斑 眉 夜 蛾 Pangrapta 
flavonacula . 黄 边 土 苦 峨 Kilema usuguronis 和 灰 双 纹 
蜡 Herculia glaucinalis ,在 表 1 和 表 2 中 依次 对 应 编 
号 1-10。 在 每 类 昆虫 内 ,我们 随机 选择 其 中 的 4/5 
作为 训练 样本 , 剩 下 的 共 112 个 图 像 作 为 测试 样本 。 
所 有 的 样本 经 过 预 处 理 ,并 用 第 1.2 节 介 绍 的 方法 
提取 特征 ,由 此 每 幅 图 像 可 以 提取 到 长 度 为 640 的 
特征 向 量 。 由 于 SVM 是 一 种 二 分 类 器 ,为 了 解决 多 
类 问题 ,我 们 分 别 采 用 了 一 对 多 的 策略 和 一 对 一 
(pairwise) 策略 :一 对 多 的 策略 中 ,对 9 类 分 类 问题 ， 
训练 了 9 个 SVM 分 类 器 ,每 个 分 类 器 可 将 某 一 特定 
的 类 从 其 余 类 中 区 分 开 , 每 类 昆虫 都 有 一 个 对 应 的 
SVM 分 类 器 来 区 分 输入 的 测试 图 像 ;一 对 一 策略 
中 ,在 任意 两 类 样本 之 间 设 计 一 个 SVM ,因此 7 个 
类 别 的 样本 就 需要 设计 g(g -1)/2 个 SVM, 对 一 个 
未 知 样本 进行 分 类 时 ,最 后 得 票 最 多 的 类 别 即 为 该 
未 知 样本 的 类 别 。 表 1 给 出 使 用 多 项 式 核 (uv + 
1) ”SVM 分 类 结果 。 其 中 中 间 6 列 为 一 对 多 SVM 
分 类 结果 ,最 后 一 列 为 一 对 一 SVM 分 类 并 投票 所 得 
结果 。 表 1 同时 给 出 了 每 一 种 的 预测 精度 及 马 修 斯 
相关 系数 (Matthews correlation coefficient, MCC )， 
MCC 计算 公式 如 下 : 
MCC = (TP x TN- FP*x FN)/sqrtl (TP+FP) 
(TP+FN) (FP+TN) (TN+FN)|] (15) 
其 中 7P, TN, FP 和 FN 分 别 表示 正确 接受 、 正 确 拒 
绝 .错误 接受 .错误 拒绝 的 样本 数量 。 从 表 1 知 ,用 
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每 类 昆虫 有 47 ~ 69 个 不 同 图 像样 本 ,这 10 类 昆虫 
为 : 白 华 若 蛾 Agylla ramelana、 朝 尺 峨 
Pseudopanthera corearia、 淡 眉 夜 蛾 Pangrapt 
umbrosa 、 稻 上 蜡 水 量 Bradina admixtalis、 点 眉 夜 蛾 
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对 一 SVM 投票 统计 所 得 独立 测试 结果 正确 率 为 
100% ,而 一 对 多 分 类 也 对 同类 和 异类 样本 有 和 较 高 的 
识别 率 ,证 明了 本 文 提出 的 特征 描述 方式 有 比较 理 
想 的 区 分 能 力 。 











表 1 多 项 式 核 SVM 类 间 类 内 匹配 测试 结果 


Table 1 Intra-class and inter-class matching results using polynomial kernel SVMs 

















同类 样本 异类 样本 三 
昆虫 编号 Intra-class samples Inter-class samples i 目 识别 率 (% ) 投票 法 精度 (% ) 
atthews correlation 
Insect no. 总 数 拒绝 数 总 数 接受 数 fficient Recognition rate Voting accuracy 
coefficien 
Total Rejected Total Accepted 
1 13 0 99 2 0.921 0.982 100 
2 11 0 101 5 0. 808 0.946 100 
3 12 1 100 2 0. 866 0.973 100 
4 10 0 102 2 0.904 0.982 100 
3 9 0 103 11 0.634 0.902 100 
6 12 0 100 4 0. 848 0.907 100 
7 9 0 103 0. 896 0.982 100 
8 10 0 102 10 0.672 0.911 100 
9 13 0 99 0. 888 0.973 100 
10 13 0 99 5 0. 828 0.955 100 
总 计 Total 112 1 1 008 46 0.817 0.958 100 














4 期 竺 乐 庆 等 : 基于 韦伯 局 部 描述 子 和 颜色 直方 图 
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本 文 提 出 的 特征 描述 方式 与 Zhu 和 Zhang 
(2012 ) 中 提出 的 基于 区 域 平均 颜色 特征 的 方法 的 
性 能 进行 了 比较 ,如 表 2。 两 种 方法 都 采用 同样 的 
多 项 式 核 SVM 进行 训练 并 分 类 识别 ,用 相同 的 图 
像 数据 集 进 行 测试 。 由 表 2 数据 可 知 ,本 文 提出 
的 方法 在 类 内 测试 和 类 间 测 试 中 都 要 比 区 域 平 均 
颜色 特征 有 更 高 的 正确 率 , 前 者 比 后 者 分 别 高 出 
约 7% 和 4% ,说 明 本 文 提出 的 昆虫 特征 描述 方式 





























在 区 分 性 和 一 致 性 方面 都 表现 出 比较 理想 的 
效果 。 

表 3 则 给 出 了 本 文 提 出 的 昆虫 识别 方法 的 时 间 
性 能 ,从 表 3 知 , 预 处 理 用 了 约 50 ms ,特征 提取 用 了 
约 30 ms, 训 练 SVM 分 类 器 需要 35 ms , 而 对 一 个 特 
征 向 量 分 类 识别 则 比较 高 效 ,用 时 小 于 1 ms。 上 述 
数据 说 明 本 文 提 出 的 昆虫 图 像 识 别 方法 能 满足 实时 
应 用 的 需要 。 























表 2 本文 方法 与 基于 区 域 平均 颜色 特征 的 方法 的 识别 性 能 比较 


Table 2 Comparison of recognition performance between the proposed method in this study and the previous method 























基于 区 域 平均 颜色 特征 的 方法 本 研究 方法 
昆虫 编号 Method based on local mean color feature Proposed method in this study 
Insect no. 类 内 测试 正确 率 (% ) 类 间 测 试 正 确 率 (% ) 类 内 测试 正确 率 (% ) 类 间 测 试 正 确 率 ( % ) 
Intra-class testing accuracy Inter-class testing accuracy Intra-class testing accuracy Inter-class testing accuracy 

1 100 100 100 97.98 

和 2 100 97.03 100 95.05 

3 75 85 91.67 98 

4 70 89.22 100 98.04 

5 88.9 85.44 100 89.32 

6 91.7 90 100 96 

7 88.9 94.17 100 98.06 

8 100 92.16 100 90.20 

9 100 95.96 100 96.97 

10 100 86. 87 100 94.95 
总 计 Total 91.96 91.57 99.11 95.43 

表 3 本文 方法 各 过 程 的 时 间 性 能 
Table 3 The time performance of each procedure of the method used in this study 
过 程 预 处 理 特征 提取 训练 单个 SVM 单 次 分 类 预测 
Procedures Preprocessing Feature extraction Training one SVM Single classification prediction 

时 间 Time (ms) 50 30 35 <1 


3 讨论 与 结论 


本 文 提出 了 一 种 全 新 的 鳞 翅 目 昆虫 图 像 特征 描 
述 方式 ,从 而 可 使 用 鳞 翅 目 昆 虫 标 本 图 像 实 现 对 昆 
虫 种 类 的 识别 。 去 除 背 景 后 的 鳞 翅 目 昆虫 图 像 经 过 
预 处 理 , 分 别提 取 左 右 翅 图 像 的 HSI 颜色 空间 的 色 
度 和 饱和 分 量 的 2D 直方 图 特征 以 及 灰 度 空间 的 
WILD 特征 ,连接 成 定 长 的 特征 向 量 。 最 后 为 每 一 类 
昆虫 训练 多 项 式 核 SVM , 以 实现 分 类 识别 。 该 方法 
在 包含 10 类 鳞 翅 目 昆 虫 的 图 像样 本 库 中 进行 了 测 
试 ,测试 结果 表明 ,该 方法 在 类 间 和 类 内 识别 的 精度 
以 及 时 间 性 能 方面 都 表现 出 比较 理想 的 效果 ,与 
Zhu 和 Zhang(2012) 中 基于 区 域 平均 颜色 特征 的 方 
法 相 比 ,本 文 提 出 的 特征 描述 在 类 间 区 分 性 和 类 内 













































































验证 性 方面 都 要 优 于 前 者 ,而 特征 向 量 的 长 度 却 相 
差 不 大 (分 别 为 400 与 640 ) ,这 是 因为 本 文 方法 兼 
顾 了 昆虫 翅 图 像 的 纹理 特征 和 颜色 特征 ,能 更 全 面 
地 反映 昆虫 翅 图 像 的 特征 信息 ,而 信息 量 并 没有 增加 
太 多 ,因此 是 一 种 较 理 想 的 鳞 翅 目 昆 虫 怒 特征 描述 方 
式 。 测 试 数据 集 上 100% 的 独立 预测 精度 证 明了 本 文 
提出 的 鳞 翅 目 昆 虫 图 像 特征 描述 方法 的 有 效 性 。 
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